临床试验数据共享:挑战和前进之路
临床试验数据共享可以促进合理的监管决策,避免不必要的重复试验,激发新的研究思路,产生新的研究假设,并从临床试验受试者、研究者的努力以及申办者的资源中获得科学知识和收益,加速新发现。
2019年底,美国国家科学院、工程院和医学院举办了一场名为“临床试验数据共享:挑战和前进之路”的公开研讨会。
本文对会议纪要的主要内容进行整理。
文章结构如下:
2019年11月18至19日,美国国家科学院、工程院与医学院在华盛顿举办了一场为期两天的公开研讨会,名为“临床试验数据共享:挑战和前进之路”。
会议旨在分析目前临床试验数据共享和再利用的情况,并探讨何种政策、技术、激励措施和治理方式可以用来进一步鼓励和增强数据共享。
研讨会的主要内容
分析共享临床试验数据带给相关方(临床试验专家、申办者、初级研究者/数据生产者、次级研究者/数据使用者、患者)的价值、潜在风险和成本;
回顾临床试验数据共享情况和再利用情况;
分析临床试验数据共享成功和失败的案例及趋势;
解读临床试验研究者、受试者、患者组织、申办者、期刊、研究机构和政府机构的观点和期望;
2015 IOM报告回顾
研讨会共同主席、强生首席医疗官Joanne Waldstreicher认为,2015 IOM概述了共享临床试验原始数据(individual participant data,IPD)的指导原则,并就关键利益相关者的作用和职责、应共享数据的时间范围、以及获取和管理共享数据的注意事项提出了建议,但2015 IOM未解决共享真实世界数据的问题。
2015 IOM
2015年1月,美国医学研究所(Institute of Medicine, IOM)发布了一份经同行评议的、可公开获取的共识报告《Sharing Clinical Trial Data: Maximizing Benefits, Minimizing Risk》,就如何促进负责任的临床试验数据共享,同时将共享的风险和负担降至最低给出建议。
The Greenwall Foundation的总裁兼首席执行官、2015 IOM研究主席Bernard Lo简要回顾了2015 IOM报告的建议。第一项建议要求建立一种数据共享的文化,第二项建议涉及要共享的临床试验数据的类型和共享的时间表,第三项建议提出了临床试验数据共享的操作策略,第四项建议呼吁建立持续的多个利益相关方参与的流程,以解决数据共享的组织结构和后勤问题。
2015 IOM以来临床试验数据共享的进展
Lo说,关于是否、如何、何时共享临床试验数据,数据生产者和数据使用者之间存在着“激烈的分歧”,例如,数据生产者(即临床试验人员)在计划和执行试验上花费了很大的精力,并且可能认为他们拥有长期使用权。另一方面,数据使用者渴望使用临床试验数据进行二次分析。他强调,目前面临的挑战是,如何达成数据共享条款,既能接受这两种观点,又能达到为患者提供好处的最终目标。
Lo认为,关于数据共享的争论可以由证据驱动,衡量利益和价值的标准是必要的。可以考虑设立反映共享临床试验数据是否会改善健康和临床结局的指标。但是仍然有一个问题,就是所有的临床试验在数据共享方面是否应该有同等的优先权,比如,一些试验可能比其他试验能够提供更大的价值。
哈佛大学临床试验事业发展计划主任Deborah Zarin说,在讨论IPD共享时,需要明确“数据”和“共享”的含义。IPD的价值在从原始数据(例如,病例报告表格)转换为数据集时会有所变化。元数据的类型、质量和可用性(例如,变量的定义)也很重要。另外,关于最初收集数据的研究小组应该在何种程度上继续参与研究,意见不一。
研究者的角度
马萨诸塞综合医院创新和生物信息学中心主任Alex Sherman建议,可以是让数据贡献者成为分析其数据的论文的作者之一。
患者的角度
独立审查小组的角度
Global Healthcare Consulting的医学主管Sonali Kochhar认为数据共享是一种良好的研究方法,理解数据共享可以促进协作,并支持外部验证和结果复制。Kochhar建议,数据共享平台可以通过提供“独立于数据生产者的标准、透明的访问路径”来帮助研究人员共享数据。
Kochhar表示,数据共享平台也面临着以下挑战:如成本回收模式(平台的成本可能由数据生产者、数据使用者或某些拨款支付)、维护安全分析环境的成本、缺乏国际公认的元数据最低标准(如果元数据不是英文,就更加复杂)、平台之间缺乏互操作性、平台使用的不同治理结构等。
资助者的角度
NIH科学政策办公室副主任Lyric Jorgenson强调了NIH在分享临床试验数据方面投入巨资的三个主要原因:临床试验数据共享支持把受试者作为合作伙伴的理念,支持NIH作为临床试验公共资助机构的责任和透明度的要求,可以为未来研究提供信息、避免浪费时间和资源的消极数据。
Vivli
Vivli执行董事Rebecca Li分享了Vivli平台自2018年启动以来的经验教训。Vivli是一个专注于临床研究数据共享的非营利组织。自成立以来,Vivli的会员已经为该平台贡献了超过4600项临床试验。在实现可持续发展方面,Vivli是一种会员制驱动的模式,从数据共享中受益的人需要做出经济贡献。
THE YODA PROJECT
耶鲁大学医学院的医学和公共卫生教授Joseph Ross介绍了耶鲁大学开放数据访问项目THE YODA PROJECT的运作,以及指导原则。YODA于2011年启动,目的是让更广泛的科学家群体获得研究数据。2014年,YODA与强生建立了伙伴关系,以促进药物临床试验数据、设备和诊断数据的共享。
SOAR
杜克临床研究所(DCRI)的生物统计学和生物信息学教授Frank Rockhold描述了SOAR平台的数据共享过程,以及目标和原则。SOAR平台由DCRI、学术界和工业界合作搭建,旨在促进研究者、数据科学家和统计学家之间临床研究数据的公开和透明共享。Rockhold认为数据共享的障碍包括病人隐私问题、成本、缺乏数据标准和数据完整性等。
CSDR
CSDR的联合创始人和主席Scott Shaunessy阐述了CSDR所面临的挑战和解决方案。CSDR于2013年作为葛兰素史克的一项临床试验数据共享计划启动,然后在2014年随着罗氏、诺华和勃林格殷格翰的加入重新启动。近年来,CSDR与技术合作伙伴(包括SAS)合作,提供分析工具,使平台体验更加“以研究人员为中心”。Shaunessy认为,平台最大的障碍是数据共享协议。
数据分析师的角度
威斯康辛大学生物统计和生物医学信息系的名誉教授David DeMets描述了从数据共享中获得价值的四个案例。从数据分析师的角度,DeMets反思了与数据共享相关的潜在利益和成本。DeMets认为,要将完整的临床试验数据文件以足够的形式和详细程度存档,以供未来使用,需要付出巨大的努力和成本。他主张设计更简单的试验,使记录和存储的数据量最小化,并建议将数据共享资源集中在关键的III期临床试验上,而不是早期研究。
出版商的角度
新英格兰医学杂志总编辑Drazen讨论了三个主要利益相关群体(临床试验人员,受试者和数据科学家)对数据共享和数据再利用的一些担忧。
临床试验专家基本上默认拥有他们的试验数据,而且几乎只与研究同一疾病领域的其他临床小组合作。受试者最关心的是隐私问题,因此数据使用者需要定义如何使用这些数据,并确保负责任的使用。数据科学家对共享数据的二次分析可以揭示有助于促进人类健康的新信息和新想法。
Drazen还以SPRINT数据分析挑战为例,讨论了如何利用临床试验数据识别重要的医学发现。
患者的角度
Patient Privacy Rights创始人和主席Deborah Peel讨论了公众对健康数据隐私的态度。Peel说,关于公众对隐私和健康数据使用的态度方面的研究非常有限。她建议受试者参考麻省理工学院Alex “Sandy” Pentland和他的“数据新政”,以增加对个人数据所有权和数据流的控制。
在讨论中,
小组成员重点围绕跨试验和平台整合数据、数据共享的知情同意等内容进行探讨。
Alex Sherman强调了合并和协调来自多个临床试验的数据的重要性。他提到了两种现有的数据共享模式:Critical Path Institute模式和肌萎缩性侧索硬化症(ALS)模式。Critical Path Institute十多年来一直在促进数据共享,将来自一个疾病领域或跨多种疾病领域的多个临床试验数据进行合并。ALS数据集将23个ALS临床试验的数据合并在一起。
使用人口数据
Ernest Hawk是MD安德森癌症中心癌症预防和人口科学部门的副总裁和负责人,他讨论了癌症预防试验中数据互操作性和平台可用性的问题。Hawk分享了三个案例以说明标准化收集“正确数据”的价值、试验样本外部有效性的重要性、在试验结束前进行数据治理和数据共享以实现安全评估的重要性。
Hawk说,癌症预防试验的数据标准化和收集往往是不够的。以吸烟为例,所有收集到的烟草使用数据都没有以标准化的形式记录。
外部有效性是指试验人群在多大程度上代表了该试验计划服务的更广泛的人群。Hawk强调了在招募少数群体时面临的一些障碍。
在数据治理和数据共享方面,Hawk以选择性COX-2抑制剂塞来昔布为例说明:单独来看,每个临床试验的不良事件太少,不足以评估与塞来昔布相关的心血管风险。而且,在每个试验中收集的数据的基线不同对分析提出了挑战。
荟萃分析挑战
科罗拉多大学丹佛分校副教授Tianjing Li介绍了一个不成功的案例:原始数据网络元分析(IPD-NMA)。使用的数据来自数据共享平台Vivli、YODA、CSDR、Project Data Sphere。Li说,该项目面临三大挑战:分别是原始数据可用性、跨平台兼容性(数据不能跨平台传输、元数据不完整、缺乏标准化等)、时间表和实用性(如从申请原始数据到获得平台批准的时间,从1个月到8个月不等)。
平台的角度
Louv介绍说,Project Data Sphere于2014年启动,是一个开放获取的数字图书馆和实验室,有125,000多名患者的数据,旨在广泛共享、整合和分析癌症临床试验数据。
在平台可用性方面,平台依靠数据提供者来保证共享数据的质量。Louv说,Project Data Sphere假设提供者将遵守其推荐的数据共享标准CDISC (Clinical Data Interchange Standards Consortium) 。面临的一个挑战是数据文件会随着时间的推移而“腐烂”(即数据库中的文件没有被使用,而那些最熟悉数据的人可能会离开的情况)。为了解决这个问题,Louv表示,Project Data Sphere在将数据纳入平台之前,会实施一项“轻触数据集接受协议”。Project Data Sphere还关注元数据的可用性,对其可搜索性进行了优化。
关于跨平台的数据互操作性,Louv说,数据用户必须自己找到跨平台工作的方法。为了解决这个问题,Louv强调需要建立“数据共享平台联盟”,在平台和研究层面上“建立和维护标准元数据”。
跨数据域的互操作性也是一个持续的挑战。例如,共享成像和基因组数据就面临着特殊的挑战,因为这两类数据的标准和身份识别协议不如其他类型的共享数据成熟。另一个挑战是成像和基因组数据与其他临床试验数据有着本质上的不同,并且通常以不同的格式存在。
在讨论中,
与会者进一步讨论了Li关于建立跨不同平台检索原始数据目录的建议。Zarin建议ClinicalTrials.gov可以提供这一功能。传染病数据观测站(IDDO)的Brittany Maguire指出,并非所有具有可用原始数据的试验都在ClinicalTrials.gov上注册,可能需要通过其他数据库(如WHO ICTRP)来寻找其他的临床试验。美国临床肿瘤学会的David Sampson认为,数据平台与期刊类似,数据共享应该从期刊出版中汲取伦理、摘要和索引、标准、基础设施、工作流和标记内容等方面的经验教训。
专家还讨论了肿瘤试验的数据共享文化、数据的及时共享、避免重复工作、数据质量等问题。
资助者的角度
Wellcome Trust的临床数据共享经理Georgina Humphreys从她作为临床试验资助者的角度讨论了与分摊成本相关的挑战。Humphreys讨论了三个与成本/资金相关的挑战和担忧:数据管理计划(如缺乏数据共享的一致标准)和共享准备,数据存储和共享管理(如共享的持续性和盈利的透明度),二次使用。
Humphreys说,解决可持续性的一个问题是考虑存储库的预期或需要的生命周期,另外可能需要使用多种融资模式。关于二次使用,需要创建一个系统来奖励那些向存储库贡献数据的人。
行业的角度
礼来分析总监、生物识别和高级分析副总裁Pandurang Kulkarni讨论了礼来共享数据的经验。
Kulkarni分享了他从学术界转到工业界后对临床试验复杂性的认识。大型试验可能有数千名参与者、数年的随访、大量的变量和大型数据集。2014年,礼来将数据共享活动移交给了CSDR,并于2019年加入Vivli。他继续说,将数据共享过程转移到Vivli已经减少了一些人员需求和成本,礼来公司正在努力降低数据标准化和匿名化的成本。
2014年,FDA对数据提交标准有了要求(例如,临床数据交换标准协会[CDISC]、研究数据列表模型[Study Data Tabulation Model, SDTM]和分析数据模型[Analysis Data Model, ADaM]标准),这意味着Vivli成员公司都以类似方式提交标准化的数据。
除了在Vivli平台上发布试验外,礼来还参与了Project Data Sphere、Trans Celerate Placebo和Standard of Care的数据共享倡议。
另外,Kulkarni说,虽然礼来公司投入了大量的时间和资源来共享试验数据,但数据的二次使用仍然非常有限。
平台的角度
美国国家心肺血液研究所(NHLBI)心血管科学部的项目官员Sean Coady从NIH的角度讨论了数据共享基础设施的可持续性挑战。
Coady说,可持续性的一个关键方面是机构对共享的承诺,NHLBI领导层30多年来一直致力于广泛共享数据。2003年发布的全国卫生研究所的数据共享政策,要求项目申请人在其申请中包括一个数据共享计划。数据显示,对获取NHLBI中研究数据的需求日益增加。
Coady详细阐述了适应不断增长的用户群所面临的三个挑战:元数据标准、管理负担、结果指标。
元数据标准。元数据标准的缺乏影响了数据的发现和可用性,尤其是存储库的扩展。
管理负担。NHLBI对提交到存储库的数据会进行审查,提交到资源库的研究越来越多,增加了管理负担。
结果指标。关于共享的数据,一些指标有用但难以跟踪,比如项目在申请中包含多少共享数据等。
在讨论中,
Coetzee敦促与会者讨论解决共享数据可持续发展挑战的办法。Coady重申,元数据标准将有助于加速发现,并有助于维护长期可用性。Kulkarni建议学术研究人员也考虑使用CDISC标准作为基础,而不是创建新的标准。他还重申了他对单一数据共享平台概念的支持,以克服无法合并来自不同平台的数据集的问题。Humphreys同意缺乏标准是一个需要优先解决的事项。
与会者讨论了数据共享的成本估算问题。Jeffrey M.Drazen询问NIH如何计算数据共享成本。Humphreys认为,所讨论的数字只是估计,而且很不一致。Coady说,鼓励发起大型临床试验的研究人员将数据共享成本作为整体数据管理过程的一部分。Sherman补充说,几年前在Critical Path Institute工作时,他们计算出将同一疾病领域的多个试验的数据合并所需的活动成本为2.5万到3万美元。
与会者还讨论了向受试者提供原始数据的成本、过时的数据等问题。
向受试者提供原始数据的成本。临床试验参与者通常有权从试验中获得他们自己的特定数据,但如果在一项大型试验中有数千名受试者要求获得他们的个人数据,那么成本可能会很高。
研究者的角度
伦敦大学学院(UCL)医学研究委员会(MRC)临床试验部门的教授Matthew Sydes从他作为研究人员的角度,讨论了数据共享和再利用的四个关键挑战。
他说,创建适合共享的数据集需要付出努力,包括从一开始就设计用于共享的试验,以及在试验完成后准备相关文档。在发布之后,通常还需要花费精力来支持数据集。数据使用者可能会联系试验调查人员,询问有关数据的问题。保护临床试验原始数据的完整性、促进再分析也是持续存在的挑战。
Sydes说,他的研究小组一直在记录用户获取共享临床试验数据的动机,并发现许多数据请求者正计划进行元分析。一些数据获取申请人实际上对个别临床试验不感兴趣,而是寻求“前瞻性的收集高质量数据”。
共享数据的另一个挑战是临床试验的监督过程。Sydes说,他们现在正致力于建立一个单位范围的数据访问委员会,最终将试验贡献给一个外部数据存储库。
申办者的角度
武田制药负责数据架构和技术的副总裁Ramin Daron从他作为临床试验申办者的经验中,总结了有效的合作关系对促进数据共享和发现新见解的重要性。
Daron描述了武田公司内部克服数据共享挑战的一个例子。Daron表示,有必要“在不同职能部门和团队之间建立信任和透明度”,并为数据的使用确定共同的目标。
Daron说,关于数据共享的价值,另一个例子是从失败的临床试验中有可能获得新的见解,这些失败的临床试验没有达到预定的结果,但可以帮助阐明疾病的生物学机理或产品的作用机制。
患者的角度
作为一个以病人为中心的研究倡导组织的负责人,Genetic Alliance的总裁兼首席执行官Sharon Terry分享了她的观点。
共享的数据应该是可查找、可访问、可互操作和可再利用的。主持讨论的加州大学旧金山分校医学院的医学教授Ida Sim说,解决查找性和可访问性问题的一个建议是创建一个跨平台搜索原始数据的单一门户。
关于数据治理,小组成员认为,应该将患者的意见放到中心位置。Sim说,让受试者参与决定如何共享和使用他们的数据可以促进他们对生物医学研究企业的信任。保持患者的信任至关重要,因为没有患者,就没有临床试验。小组成员还讨论了跨平台的通用数据请求。
数据用户的角度
俄勒冈健康与科学大学的医学、医学信息学和临床流行病学教授Mark Helfand作为共享数据的用户,分享了他的观点。
Helfand说,用户不可能学习所有的东西,对于主要目标是系统回顾和荟萃分析的研究人员来说,导航原始临床试验数据可能是具有挑战性的。而且,系统审查元数据的深度是一个问题,这通常超出了目前平台所能解决的范围。
数据生产者/分配者的角度
肿瘤临床试验联盟的主席、哈佛大学医学院的外科教授Monica Bertagnolli总结了联盟在2015年到2019年底之间,在数据共享方面的贡献。她认为,联盟数据共享由三个关键要素实现:规划、数据标准、资源。
规划。数据共享从一开始就计划好了,并在合同、协议以及受试者同意表格中有具体规定。
数据标准。合作小组的合并推动了标准系统的使用,Bertagnolli称这是一个重大的改进。
资源。需要有价值的资源来支撑联盟数据共享平台的可用性。
平台的角度
Elligo Health Research的首席科学官Rebecca Kush从平台的角度讨论了接下来的步骤。
2004年,NCI、FDA、HL7和CDISC联合开发了BRIDG(Biomedical Research Integrated Domain Group),以连接临床研究和医疗保健,增强数据互操作性。
Kush说,BRIDG现在已经成为全球标准,已经通过了HL7、CDISC和国际标准组织的批准。另外,共享有意义数据的技术能力应该是独立于平台的,而数据标准使之成为可能。通过标准和统一的通用数据格式,可以克服数据共享的技术障碍。
在讨论中,
与会者继续讨论应该共享哪些数据。Amy Nurnberger主张所有的试验都应该共享,因为对数据共享的期望促进了良好的数据管理。Sim提出了应该由谁来决定共享试验数据的范围的问题。Helfand说,当务之急是考虑针对某一特定试验应该分享哪些数据,而不是关于是否应该分享每一项试验的所有数据。
申办者的角度
UCB Biosciences的高级主管和全球公共政策主管Liz Roberts讨论了试验申办者如何使共享数据对用户更有用。
Roberts强调了增加数据共享价值的三个关键:独立审查小组评估提交给平台的数据请求的科学价值、申办者对研究和开发之外的临床试验数据的支持、国际医学杂志编辑委员会(ICMJE)的要求(如对论文的数据共享进行规范、要求在试验注册中包含数据共享计划等)。
研究者的角度
牛津大学临床试验服务处和流行病学研究处(CTSU)副主任Colin Baigent举例说明了原始数据荟萃分析如何导致患者护理的新发现。此外,Baigent同意其他小组成员的意见,即焦点应该从使所有的试验可用来分享,转变为使信息最丰富的数据可用,并鼓励它们的再利用。他同意,应该把注意力放在以适合共享的方式收集数据和维护数据上,而不是例行公事地将数据存储在某个地方。
机构的角度
麻省理工学院数据管理服务的项目主管Amy Nurnberger讨论了机构和其他临床研究利益相关者在共享试验数据中的角色和关系,以及在数据管理活动中使用库的价值。Nurnberger断言,数据共享的价值是值得付出代价的,但要充分实现这一价值,还需要解决“基础设施债务”问题。另一个问题是需要一个数据共享的激励结构,比如倡导和使用持久的唯一数据标识符,作为临床试验数据输出的跟踪。
资助者的角度
Wellcome Trust的临床数据共享经理Georgina Humphreys讨论了Wellcome如何将研究数据的价值最大化,以及开放共享临床试验原始数据如何对患者护理产生直接影响。作为临床科学的资助者,Humphreys说,Wellcome Trust有一个开放获取数据的政策,将研究数据的价值最大化。证据表明,那些数据开放的研究论文会被更频繁地引用。
在讨论中,
Ida Sim总结了共享数据的三个主要模式:竞争前联合模式、数据产生者与数据使用者直接协作、独立第三方平台数据共享。Nurnberger提出了第四种,在这个模式中,临床试验数据被临床试验系统之外的其他人使用,特别是用于机器学习或人工智能应用。Nurnberger指出,未来需要考虑的一些重要问题有:需要做些什么才能让10年后的数据有用?这方面的投资如何进一步扩大?
结束语:在前进中寻找价值
Waldstreicher回顾了自2015 IOM以来所取得的进展。她注意到,这次研讨会包括了关于跨平台共享元分析数据的讨论,而5年前的讨论仅仅是关于如何促进数据共享,而今天的平台还不存在。她提出分享失败研究的数据很重要。
Waldstreicher说,还有很多工作要做,比如跨试验和跨平台分析数据的必要性和单一平台的优点的讨论。公司需要数据来获得产品许可,而对于学术界的研究人员来说,数据可以成为职业晋升的货币。她重申了Bernard Lo的一句话:数据共享很重要,因为这是医学和医疗保健的基础科学。
(Chris整理)
----------- End -----------
虚拟临床试验:挑战和机遇
美国FDA如何监管医疗AI:监管框架和当前获批产品
合作制药时代,虚拟制药公司发展的新契机
近两年AI药物发现领域国内外重要投资:7项上亿美元,21项超千万美元
跨界者在行动:互联网巨头在AI药物发现方面,都做了哪些工作
涉及AI的临床试验的国际指南SPIRIT-AI和CONSORT-AI在顶尖医学杂志发布
AI药物发现的数据共享模式探索:以十大顶尖药企参加的MELLODDY项目为例
AI辅助药物临床试验受试者招募:几种方式和几个问题
CDE征求意见的模型引导的药物研发(MIDD)是什么
虚实结合的AI药物发现:现场数据生成,模型迭代更新